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【摘要 】 当前 无 论 是 物理 听诊 器 亦 或 是 电子 听诊 器 的 肺 音 听 诊 结果 仍然 主要 是 依靠 医生 专业 的 听诊 鉴别 能 
尚未 能 够 实现 智能 诊断 判读 。 当 患者 在 家 受到 肺 部 疾病 影响 时 ， 无 法 自行 发 现 肺 部 异常 而 耽误 治疗 ; 当 处 于 呼吸 道 传 
染病 救治 过 程 中 ， 入 耳 式 的 听诊 占 容 易 受到 污染 造成 院内 感染 。 尽 管 听诊 音 包含 了 丰富 的 健康 状态 信息 ， 由 于 缺乏 标 
准 化 的 采集 方法 、 分 类 标准 和 分 析 工 具 ， 使 得 听诊 音 的 客观 分 析 和 应 用 在 实践 中 受到 了 限制 。 本 研究 通过 采用 统一 的 
听诊 音 采集 设备 和 流程 进行 肺 部 听诊 音 数据 采集 、 整 理 、 数 据 库 设 计 ， 使 用 软件 MatlabR2017a 进行 数据 管理 和 分 析 ， 
建立 了 健康 群体 和 肺 部 疾病 患者 群体 的 肺 部 听诊 音 数 据 库 , 制订 一 套 标准 的 听诊 音 分 类 、 标 注 规范 .音频 特征 信号 参数 ， 
构建 一 个 用 于 存储 、 管 理 和 分 析 肺 部 听诊 音 数据 的 系统 ， 为 肺 部 疾病 的 筛 查 、 监 测 以 及 医学 人 工 智能 应 用 转化 等 相关 
研究 提供 重要 的 数据 支持 。 研 究 积累 了 肺 部 听诊 音 音 频数 据 库 建 库 经 验 ， 为 音频 类 数据 库 管理 和 分 析 提 供 有 益 的 参考 
和 借鉴 ， 为 支持 后 续 医 学 人 工 智能 辅助 听诊 应 用 于 肺 部 疾病 得 查 与 监测 黄 定 基础 ， 具 有 重要 的 医学 价值 和 实际 应 
义 。 
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[Abstract] Currently, the results of lung sound auscultation with either physical or electronic stethoscopes still rely 

mainly on the doctor's professional auscultation identification ability, which has not yet been able to realise intelligent diagnosis 

and interpretation. When patients are affected by lung diseases at home, they are unable to detect lung abnormalities on their own 

and delay treatment; when they are in the process of rescue and treatment of respiratory infectious diseases ，in-ear stethoscopes 

are easily contaminated and cause nosocomial infections. Although stethoscopic sounds contain a wealth of information about health 

status ，the lack of standardised collection methods ，classification criteria and analysis tools has limited the objective analysis 

and application of stethoscopic sounds in practice.In this study, the data collection ，arrangement and database design of the 

lung auscultation sound were carried out by using the unified auscultation sound collection equipment and process.The study used 

the software metlabR2017a for data management and analysis to create a database of lung auscultation sounds in a healthy group 

and a group of patients with lung disease.A database of lung auscultation sounds was established for healthy groups and groups of 


patients with lung diseases.A standard set of classification of auscultatory tones, labelling specifications, audio characteristic 
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signal parameters were developed.Building a system for storing, managing and analysing lung auscultation sound data to provide 


important data support for research related to the screening and monitoring of lung diseases and the translation of medical artificial 


intelligence applications.The study accumulated the experience of building an audio database of lung auscultation sounds, 


provided a useful reference for the management and analysis of the audio database, and laied the foundation for supporting the 


subsequent application of medical artificial intelligence—assisted auscultation in the screening and monitoring of lung diseases, 


which was of great medical value and practical application. 
【 Key words 】 
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随 着 医学 科学 技术 的 发 展 ， 肺 部 疾病 的 诊断 越 来 越 
依赖 于 医学 数据 ， 肺 部 听诊 音 作为 肺 部 疾病 诊断 的 重要 
依据 之 一 ， 其 标准 音频 数据 库 建 立 和 数据 分 析 显 得 尤为 
重要 。 然 而 ， 建 立 一 个 高 质量 的 肺 部 听诊 音 数据 库 并 非 
易 事 。 医 务工 作者 需要 考虑 如 何 确保 数据 的 准确 性 和 可 
靠 性 ， 如 何 有 效 地 组 织 和 存储 数据 ， 如 何 利 用 人 工 智能 
和 机 器 学 习 技术 对 数据 进行 处 理 和 分 析 等 问题 '" 。 近 
年 来 ， 人 工 智 能 和 机 可 学 习 技术 为 解决 这 些 问 题 提 供 了 
新 的 可 能 。 这 些 技术 能 够 提高 数据 采集 、 处 理 和 分 析 的 
效率 和 准确 性 ， 使 人 们 从 海量 的 医疗 数据 中 提取 出 更 有 
价值 的 信息 ” 。 因 此 ， 利 用 这 些 技术 构建 肺 部 听诊 音 
数据 库 系统 ， 成 为 当前 肺 部 听诊 音 数据 库 建 库 技术 及 方 
法 研究 的 重要 方向 。 

肺 部 听诊 是 医生 在 诊断 和 监测 呼吸 系统 疾病 时 常用 
的 重要 手段 。 肺 部 音频 信号 可 以 提供 许多 有 价值 的 信息 ， 
如 呼吸 音 、 杂 音 等 ， 可 以 辅助 医生 诊断 和 判断 疾病 的 类 
型 和 严重 程度 ” 。 然 而 ， 肺 部 听诊 音 的 解读 和 分 析 常 
需要 医生 具备 丰富 的 经 验 和 专业 知识 。 传 统 的 肺 部 听诊 
音 主要 依靠 临床 实践 和 经 验 积累 ， 但 这 种 方式 的 局 限 性 
在 于 其 主观 性 较 强 ， 存 在 个 体 差异 ， 对 医生 培训 和 病情 
判断 的 一 致 性 有 一 定 影响 “5 。 为 了 解决 这 些 问 题 ， 
国内 外 研究 者 探索 利用 机 如 学 习 和 信号 处 理 技 术 来 对 肺 
部 听诊 音 数据 进行 分 析 和 建 模 。 通 过 机 带 学 习 和 神经 网 
络 模型 ，AI 可 以 对 大 量 经 过 声音 标注 的 呼吸 音 数 据 进 
行 快速 学 习 ， 从 而 实现 对 呼吸 音 的 自动 分 析 '“”。 呼 吸 
音 的 自动 识别 和 分 类 可 以 分 为 两 步 : 特征 提取 和 识别 分 
类 。 然 而 ， 在 呼吸 音 领 域 的 AI 发 展 过程 中 ， 面 临 一 个 
主要 问题 ， 即 缺乏 可 用 于 研究 算法 和 比较 不 同 算法 的 公 
共 高 质量 大 型 呼吸 音 数据 库 ， 这 也 是 AI 在 呼吸 音 领 域 
发 展 的 主要 障碍 ” 。 建 立 肺 部 听诊 音 数据 库 可 以 为 自 
动 化 诊断 系统 、 疾 病 监 测 和 健康 评 佑 等 提供 基础 。 随 着 
智能 医疗 和 远程 医疗 的 发 展 ， 建 立 一 个 公共 的 、 大 规模 
的 肺 部 听诊 音 数 据 库 也 具有 重要 意义 。 这 样 的 数据 库 可 
以 促进 医疗 资源 共享 和 协作 研究 ， 提 高 肺 部 疾病 的 诊断 
和 治疗 水 平 。 因 此 ， 对 于 肺 部 听诊 音 数 据 建 库 技术 及 方 
法 的 研究 可 以 帮助 改善 传统 肺 部 听诊 方法 的 不 足 且 推动 
肺 部 疾病 的 早期 诊断 和 治疗 。 
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1 肺 部 听诊 音 的 采集 


1.1 音频 数据 采集 设备 

本 研究 采用 美国 3M 公司 的 3MW Littmann@3200 听 
诊 右 型 电子 听诊 器 获取 肺 部 听诊 音信 息 数 据 ， 该 听诊 器 
有 以 下 特点 : 通过 数字 信号 传导 而 非 声学 振动 来 采集 呼 
吸音 数据 ; 可 以 收集 更 广 的 音频 范围 ， 并 进行 数字 信号 
转换 ;可 同步 生成 视觉 声音 图 谱 ， 即 在 听 到 呼吸 音 的 同 
时 看 到 呼吸 音 的 波形 图 谱 。 上 述 特 点 有 助 于 使 用 者 调整 
听诊 技术 ， 获 得 更 准确 的 听诊 结果 。 该 类 型 听诊 器 
与 普通 听诊 探头 相 比 ， 可 以 听 到 更 低频 的 声音 ， 音 域 更 
广 、 响 度 更 大 ， 且 具有 和 良好 的 环境 降 噪 效果。 璧 如 其 采 
集 频率 范围 为 20~2 000 Hz， 采 样 频率 为 4kHz， 可 将 声 
音 放 大 24 倍 ， 并 能 降低 听诊 探头 端的 杂音 ， 提 高 声学 
传导 质量 。 此 外 , 其 还 具备 录音 、 存 储 和 数据 传输 功能 ， 
可 以 连接 电脑 ， 并 可 使 用 匹配 的 音频 软件 进行 分 析 ， 是 
建立 标准 肺 部 听诊 音 的 理想 工具 。 
1.2 ”数据 获取 
1.2.1 研究 对 象 准备 : 本 研究 研究 对 象 均 来 自 广 州 医科 
大 学 附属 第 一 医院 ( 患者 来 源 于 呼吸 科 住院 部 ， 健 康 群 
体 来 源 于 医院 员工 ) ， 入 组 前 使 其 充分 知情 肺 部 听诊 音 
建 库 研究 ， 告 知 采集 流程 和 需 其 配合 的 环节 ， 并 请 其 签 
署 知 情 同意 书面 材料 。 依 据 被 采集 人 的 年 龄 、 性 别 、 基 
础 病 、 被 采集 时 的 身体 状态 等 记录 详细 信息 并 做 好 分 组 。 
本 项 目 是 一 项 开放 式 的 研究 探索 ， 参 考 前 人 相关 研究 ， 
招募 总 计 350 名 参与 者 作为 研究 样本 ， 这 些 参与 者 将 被 
划分 为 各 含 50 人 的 七 组 ， 以 便于 进行 详尽 的 比较 和 分 
析 。 该 设计 标准 可 确保 研究 的 准确 性 和 有 效 性 ， 同 时 也 
保护 参与 者 的 权益 。 本 研究 经 广州 医科 大 学 附属 第 一 医 
院 伦理 审查 通过 ( 医科 伦 审 2017 第 82 号 ) 。 
1.2.1.1 纳入 标准 : (1 ) 志愿 参与 。( 2 ) 年 龄 = 18 岁 。 
(3 ) 健康 人 群 : 既往 无 肺 部 慢性 疾病 、 无 粉尘 常 期 
暴露 史 且 无 吸烟 习惯 ,不 受 器 质 性 心血 管 疾病 的 困扰 者 ; 
@ 近 3 周 内 无 急性 上 呼吸 道 感 染 及 咳嗽 、 咳 痰 等 呼吸 道 
症状 ; @@ 所 有 研究 对 象 在 过 去 六 个 月 内 进行 的 健康 体 
检 中 ， 胸 部 X 光 未 发 现任 何 肺 部 病变 ， 并 旦 心电图 表 
现 正 常 的 。COPD 患者 : 四 有 呼吸 困难 、 慢 性 咳嗽 或 咳 
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痰 ， 有 危险 因素 暴露 史 ; @) 肺 功能 检查 ， 吸 入 支气管 扩 
张 剂 后 第 一 秒 用 力 呼 气量 ( FEV1 ) / 用 力 肺活量 (FVC ) 
<0.7; 色 无 大 量 胸腔 积 液 或 气胸 的 并 发 证; 册 临 床上 确 
诊 为 COPD; 符合 第 1~3 项 或 符合 第 3~4 项 。 支 气管 哮 
呀 患者 : QD) 经 常 出 现 反复 喘息 、 气 急 、 胸 闽 或 咳嗽 ， 多 
与 接触 变 应 原 、 冷 空气 、 物 理 、 化 学 刺激 、 病 毒性 上 呼 
吸 道 感染 、 运 动 等 有 关 ; @ 发 作 时 在 双 肺 可 闻 及 散在 或 
弥漫 性 、 以 呼 气相 为 主 的 哮 鸣 音 ， 呼 气相 延长 ， @ 上 述 
症状 通常 可 经 使 用 平 喘 药 物 治 疗 后 缓解 或 自行 缓解 ; 由 
除外 其 他 疾病 所 引起 的 嘴 息 、 气 急 、 胸 问 或 咳嗽 ;名 对 
症状 不 典型 者 (如 无 明显 喘息 或 体征 ) ， 应 最 少 具备 以 
下 三 项 中 至 少 一 项 阳性 : (a) 支气管 激发 试验 ( 或 运 
动 激发 试验 ) 阳性 ，(b ) 支气管 舒张 试验 阳性 ，(e ) 
层 夜 PEF 变异 率 >= 20%; 人 @I 临 床上 确诊 为 支气管 哮喘 ; 
符合 第 1~4 项 或 符合 第 4~5 项 或 符合 第 6 项 者 。 支 气管 
扩张 患者 : 中 幼年 时 期 有 诱发 支气管 扩张 的 呼吸 道 感染 
史 ， 如 麻疹 、 百 日 咳 或 流感 后 肺炎 病史 ,或 肺结核 病史 
等 ; @ 出 现 长 期 慢性 咳嗽 、 咳 脓 痰 或 反复 咯血 症状 ; @ 
高 分 辨 率 计 算 机 断层 扫描 (HRCT ) 显示 支气管 扩张 的 
异常 影像 学 改变 ; 由 临床 上 确诊 为 支气管 扩张 ; 符合 第 
1~3 项 或 符合 第 4 项 者 。 间 质 性 肺 疾病 患者 : 在 双 侧 
下 肺 区 会 有 干 鄂 音 或 湿 曙 音 ， 尤 其 是 在 吸 气 末期 更 加 明 
显 ; @@ 胸 部 XX 光 显示 出 弥漫 性 的 阴影 或 不 常见 的 结 节 
样 间 质 性 阴影 ， 以 及 支气管 壁 增 厚 和 血管 周围 间隙 的 突 
出 ， 小 的 规则 或 不 规则 阴影 以 及 小 的 外 周 性 环 状 阴影 ; 
@@ 肺 功能 检测 揭示 了 限制 性 通气 功能 障碍 和 和 气体 交换 功 
能 减退 ;由 通过 对 支气管 肺泡 灌 洗 液 (BALF ) 的 细胞 
学 、 病 原 学 、 生 化 和 炎症 介质 等 检测 ， 可 以 依据 BALF 
中 炎症 免疫 效应 细胞 的 比例 将 间 质 性 肺 疾病 分 为 淋巴 细 
胞 增多 型 和 中 性 粒 细 胞 增多 型 ，@@) 通 过 支气管 肺 活 检 或 
外 科 肺 活检 获取 肺 组 织 进行 病理 学 检查 确诊 为 间 质 性 肺 
疾病 ; (@ 临 床上 确诊 为 间 质 性 肺 疾病 。 肺 炎 患 者 : 由 咳 
嗽 、 咳 痰 ,或 原 有 呼吸 道 疾 病症 状 加 重 ,， 并 出 现 脓 性 痰 ， 
伴 或 不 伴 胸 痛 ; @ 发 热 ,， 体温 = 38 CC; @@ 在 肺 部 实 变 
病变 或 湿 嘿 音 中 可 以 观察 到 感染 的 迹象 ;， @ 白 细胞 计数 
(WBC ) >10 x 10%L 或 4< x 10%L, 伴随 或 不 伴随 核 左 移 ; 
胸部 X 射线 检查 可 能 会 显示 斑 片 状 浸润 阴影 或 间 质 
性 变化 ， 时 伴随 有 胸腔 积 液 ; @) 临 床上 确诊 为 肺炎 ; 符 
合 第 1~4 项 中 任意 一 项 和 第 5 项 。 肺 部 肿瘤 患者 : 四 胸 
部 CT 提示 肺 部 肿瘤 ， 或 提示 肺 部 占 位 且 考 虑 肿瘤 可 能 
性 大 ; @ 肺 部 肿瘤 直径 >2 cm; 图 临床 上 考虑 肺 部 肿瘤 
可 能 ; 他 未 合并 大 量 胸腔 积 液 和 气胸 ; @ 未 行 手术 切除 ; 
临床 上 已 确诊 为 肺 部 肿瘤 ; 符合 第 1~5 项 或 符合 第 项 
2、4、5、6 项 者 。 肺 部 肿瘤 患者 : 中 胸部 CT 提示 肺 部 
肿瘤 ， 或 提示 肺 部 占 位 且 考 虑 肿瘤 可 能 性 大 ; @ 肺 部 肿 
瘤 直径 >2 cm; @) 临 床上 考虑 肺 部 肿瘤 可 能 ; @ 未 合并 
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大 量 胸腔 积 液 和 气胸 ; 人 @ 未 行 手术 切除 ，@ 临 床上 已 确 
诊 为 肺 部 肿瘤 ; 符合 第 1~5 项 或 符合 第 项 2、4、5、6 
项 者 。 

1.2.1.2 排除 标准 : (1 ) 确诊 患 有 奖 病 并 且 目 前 正在 
接受 药物 治疗 以 控制 病情 ; (2) 妊娠 ; (3) 肺 部 切除 
手术 的 患者 ; (4) 处 于 昏迷 状态 或 有 意识 障碍 的 患者 ; 
(5 ) 无 法 配合 研究 流程 的 个 体 ，〈6 ) 在 重症 监护 病房 
(ICU ) 接受 治疗 或 病情 处 于 危急 状态 的 患者 ; (7 ) 未 
签署 知情 同意 书 ; (8 ) 同时 满足 以 上 两 个 或 两 个 以 上 
的 纳入 标准 的 患者 。 

1.2.2 ”录音 环境 准备 : 要求 独 立 安静 、 温 度 适宜 的 空间 
进行 肺 部 听诊 录音 ， 录 音 时 环境 噪音 不 高 于 40~50 dB。 
1.2.3 资料 收集 : 收集 研究 对 象 的 病史 详细 信息 及 其 相 
关 检 查 资 料 (包括 年 龄 、 身 高 、 体 质量 、 主 要 症状 、 吸 
烟 史 、 呼 吸 系统 相关 主要 诊断 、 肺 CT 结果 、 肺 功能 检 
查 报 告 数 据 等 ) 。 

1.2.4 录音 方法 : 嘱 研 究 对 象 放松 心情 ， 平 静 呼 吸 数 分 
钟 。 选 用 3M™ Littmann@3200 型 电子 听诊 器 ， 按 人 民 卫 
生出 版 社 第 9 版 4 诊断 学 ) 肺 部 听诊 要 求 对 喉 部 .左右 上 、 
中 、 下 肺 部 、 左 右 肩 甩 骨 下 共 9 个 部 位 进行 听诊 (图 1)， 
录取 所 有 人 和 组 研究 对 象 的 肺 部 听诊 音 ， 同 时 填写 资料 表 
格 。 每 个 点 至 少 采 集 15 秒 的 呼吸 音 , 研究 对 象 保持 安静 。 
听诊 天 探头 紧 贴 研究 对 象 皮 肤 ， 开 始 采集 后 ， 嘱 研究 对 
象 深呼吸 ， 确 保 每 次 采集 的 呼吸 音 包含 2~3 个 完整 的 呼 
吸 周期 ”1 。 


B 


注 : A 表示 背面 ，B 表示 正面 。 
图 1 肺 部 听诊 音 采集 部 位 示意 图 


Figure 1 Schematic diagram of the site of collection of lung auscultation 


sounds 


1.2.5 质量 控制 : 由 2 名 呼吸 内 科 主 治 医 师 分 别 听取 所 
采取 的 肺 音 进行 录音 鉴别 与 诊断 ， 如 存在 分 歧 ， 再 组 织 
第 3 名 呼吸 内 科 主 治 医师 听取 鉴别 ， 消 除 歧义 后 录用 数 
据 。 

2 数据 传输 与 存储 

2.1 数据 传输 
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3M” Littmann@3200 型 电子 听诊 右 内 存 有 限 ， 可 存 
储 12 段 长 度 为 30s 的 音频 ， 因 此 录制 完 每 个 研究 对 象 
都 需 将 肺 音 音频 通过 蓝牙 和 听诊 器 适 配 的 软件 StatAssist 
传输 到 电脑 端 ， 需 注 明 每 段 音频 来 源 于 具体 研究 对 象 所 
对 应 的 肺 部 部 位 。 
2.2 ”数据 存储 

传输 到 电脑 端的 肺 音 音 频 以 zsa 格式 保存 ， 文 件 名 
会 自动 产生 一 串 编码 ， 为 了 与 相应 研究 对 象 对 应 ， 可 在 
编码 后 加 上 研究 对 象 姓名 以 对 应 到 具体 的 人 ， 该 段 zsa 
格式 的 音频 即 为 原始 数据 。 
2.3 ”音频 导出 

将 zsa 格式 音频 导出 为 wav 格式 保存 ， 以 便于 后 续 
音频 标注 和 分 析 。 将 同一 研究 对 象 的 肺 音 音 频 导 入 同一 
文件 夹 ， 文 件 夹 以 原文 件 名 命名 ， 按 每 段 音频 所 对 应 部 
位 重合 名， 以 便于 每 条 肺 音 可 以 准确 对 应 到 某 个 研究 对 
象 的 具体 身体 部 位 。 
2.4 数据 脱 敏 

包含 研究 对 象 姓 名 的 肺 音 音 频数 据 属于 敏感 信息 ， 
可 能 因 设备 遗 失 或 电脑 病毒 而 导致 信息 泄露 ， 故 需 对 数 
据 进行 脱 敏 。 将 文件 名 全 部 随机 重 命名 ， 并 将 重 命名 后 
的 数据 与 研究 对 象 姓名 、 基 本 信息 等 对 应 起 来 。 
2.5 云端 数据 库 的 建立 

存储 在 电脑 端的 数据 有 可 能 因 电脑 故障 而 丢失 ， 故 
将 脱 敏 数据 传人 云端 是 很 有 必要 。 设 立 一 个 只 供 本 地 网 
络 访问 的 云端 数据 库 ， 对 数据 的 存储 及 安全 都 有 良好 的 
保障 。 将 未 标注 、 标 注 后 及 审核 后 各 阶段 数据 分 别 保存 
在 云端 数据 库 ， 方便 统 计数 据 纳 排 情况 及 数据 溯源 。 


3 ”音频 数据 的 预 处 理 


3.1 肺 音 降 噪 

肺 音信 号 的 预 处 理 首先 是 去 除 肺 音 中 的 噪声 ， 目 的 
是 提高 呼吸 音信 号 的 清晰 度 和 质量 ， 准 确 地 捕捉 和 识别 
肺 部 声音 信号 。 电 子 听 诊 器 虽然 有 一 定 的 降 噪 能 力 ， 但 
在 肺 音 的 采集 过 程 中 会 不 可 避免 地 引入 一 些 噪声 ， 包 括 
来 源 于 外 部 环境 杂 声 、 听 诊 咒 电路 内 部 产生 的 电流 干扰 、 
以 及 探头 与 皮肤 接触 面 的 摩擦 声 和 心音 等 人 体内 部 噪声 
等 '“") 。 原 始 肺 音信 号 的 噪声 来 源 很 多 ， 如 果 不 能 有 效 
地 滤 除 噪声 ， 将 对 肺 音 的 识别 过 程 产生 较 大 影响 。 
3.1.1 肺 音 信号 的 高 通 滤 波 去 噪 : 肺 音信 号 的 高 通 滤波 
去 噪 的 目的 是 去 除 低 频 噪 音 ， 保 留 高 频 部 分 ， 从 而 提取 
出 肺 音信 号 的 有 用 信息 。 

肺 音信 号 中 的 呼吸 音 和 心脏 音 一 般 集 中 在 较 高 的 频 
率 范 围 内 ， 而 噪音 通常 是 低频 信号 。 通 过 应 用 高 通 滤波 
器 , 可 以 抑制 低频 噪音 的 干扰 , 使 得 肺 音信 号 更 加 清晰 。 
高 通 滤波 的 关键 是 选择 合适 的 截止 频率 和 滤波 器 参数 ， 
以 充分 去 除 低频 噪音 , 同时 保留 肺 音信 号 中 的 有 用 信息 。 
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3.1.2” 肺 音信 号 的 低 通 滤波 去 噪 : 根据 肺 音信 号 的 信号 
寺 点 ， 设 计 一 个 低 通 滤波 器 ， 可 以 将 肺 音信 号 中 高 频 部 
分 去 除 ， 保 留 低频 部 分 。 进 行 滤波 操作 ， 将 设计 好 的 低 
通 滤波 器 应 用 到 肺 音信 号 上 ， 通 过 滤波 操作 可 以 将 高 频 
噪声 去 除 ， 同 时 保留 肺 音信 号 中 的 低频 成 分 。 进 行 信号 
重 构 ， 经 过 滤波 操作 后 ， 得 到 的 信号 可 能 会 有 一 定 的 变 
形 ， 需 要 进行 信号 重 构 处 理 ， 使 其 恢复 到 原始 形态 。 
3.2 人工 标注 
3.2.1 音频 标注 软件 : Audacity 是 一 款 公 开 免 费 的 音频 
处 理 软件 ， 用 于 录音 和 编辑 音频 ， 是 自由 、 开 放 源 代 
码 的 软件 分 析 。 该 软件 具有 的 可 视 化 工具 可 用 于 分 析 
音频 或 其 他 信号 数据 ， 支 持 Python，Perl 或 任何 支持 命 
名 管道 的 语言 编写 脚本 ,兼容 性 强 ， 可 在 Mac OS X、 
Microsoft Windows 、GNU/Linux 和 其 他 操作 系统 上 运作 。 
3.2.2” 肺 部 听诊 音标 注 者 的 选择 : 肺 部 听诊 音标 注 的 准 
确 性 在 很 大 程度 上 影响 模型 的 识别 效率 ， 呼 吸 内 科 医 生 
对 肺 部 听诊 音 的 识别 比较 有 经 验 ， 也 有 利于 提高 音频 数 
据 标 注 的 准确 度 , 故 标注 者 的 选择 建议 是 呼吸 内 科 医 生 。 
由 于 采 录 设备 录制 的 声音 与 临床 实际 听 到 的 声音 有 些许 
差别 ， 所 以 每 位 标注 者 需 经 过 专业 培训 后 方 能 正式 参与 
肺 音标 注 。 
3.2.3 ”标注 流程 : 将 待 标注 音频 导入 Audacity 软件 ， 将 
默认 的 波形 图 转换 为 频谱 图 模式 ， 频 谱 图 可 直观 显示 一 
个 呼吸 周期 及 该 呼吸 周期 的 吸 气相 和 呼 气相 ， 有 利于 快 
速 选区 并 标注 ， 选 定 区 域 后 输入 标签 。 为 了 使 标注 更 加 
精确 ， 将 整 段 音频 中 每 个 呼吸 周期 先 框 选 出 来 ， 再 对 吸 
气相 和 呼 气相 进行 区 分 后 作 定性 (标注 为 正常 、 湿 哆 音 、 
吵 鸣 音 、 喘 鸣 音 或 屠 音 ) ， 有 助 于 呼吸 音 的 特征 提取 。 
不 完整 的 呼吸 片段 可 能 会 降低 特征 提取 的 效果 ， 故 只 标 
注 较 为 完整 的 呼吸 周期 。 

标注 的 内 容 包括 : 呼吸 周期 的 呼 气 段 和 吸 气 段 ， 正 
第 、 湿 嘿 音 和 干 虽 音 发 生 的 位 置 ( 精确 到 ms ) ， 干 嗓 
音 细 分 的 类 型 。 还 包括 对 呼吸 音 音频 质量 等 级 标注 ， 音 
频 质 量 等 级 按照 音频 质量 的 好 坏 ， 依 次 分 级 为 、 工 、 
亚 三 个 等 级 ， 其 中 工 级 最 优 。 评 价 标注 包括 音频 的 信 品 
比 、 噪 音 时 长 占 比 及 人 工 主观 评价 。 标 注 完成 后 ， 带 标 
签 的 音频 将 以 Audacity Project File (aup3 ) 格式 保存 。 
标注 时 所 有 标注 者 使 用 同 种 品牌 同 种 型 号 的 收听 设备 
( 铁 三 角 ATH-M20X 头 戴 式 耳 机 ) ， 使 所 有 标注 者 尽 
可 能 获得 较为 一 致 的 听觉 体验 。 
3.2.4 标签 审核 : 对 于 标注 过 程 中 有 争议 的 部 分 ， 需 进 
行 公开 讨论 ， 最 终 获 得 一 致意 见 的 ， 了 予以 采纳 ; 否 最 终 
无 法 达成 一 致意 见 ， 则 剔除 该 条 数据 。 全 部 音频 标注 完 
成 后 ， 由 呼吸 与 危重 症 学 科 高 年 资 医生 对 所 有 音频 进行 
审核 ， 修 改 错误 或 不 规范 标签 ， 并 剔除 低 质量 数据 ( 品 
音 太 多 影响 判断 或 音量 太 小 难以 分 辨 的 音频 ) 。 经 过 审 
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核 的 标签 即 可 用 于 训练 AI 模型 。 

3.3 ， 肺 音 识别 机 器 学 习 算法 及 其 模型 建立 过 程 

3.3.1 湿 鹃 音 和 哮 鸣 音 识别 及 其 持续 时 间 ， 湿 喝 音 和 哮 
鸣 音 是 2 种 常见 的 呼吸 音 ， 可 以 通过 听诊 器 或 其 他 听诊 
设备 进行 识别 。 湿 哆 音 是 由 于 呼吸 道 竺 膜 分 泌 物 增多 导 
致 的 湿润 声音 。 其 通常 类 似 于 呼吸 道中 的 液体 在 被 吸入 
或 呼出 时 产生 的 吐 噜 声 。 湿 哆 音 可 以 是 细小 而 清澈 的 ， 
也 可 以 是 较为 粗糙 和 响亮 的 。 它 们 可 能 由 于 感染 、 充 
血 、 分 泌 物 过 多 或 阻塞 引起 。 湿 鹃 音 的 持续 时 间 可 以 因 
患者 情况 而 异 ， 从 持续 数秒 到 几 分 钟 不 等 "1 。 哮 鸣 音 
是 由 于 气流 通过 狭窄 的 呼吸 道 导致 的 高 音频 咳嗽 声 或 呼 
味 声 。 这 种 声音 通常 类 似 于 从 狭 窗 的 空间 经 过 的 高 速 所 
流 所 产生 的 噪音 。 哮 鸣 音 可 以 是 连续 的 或 间断 的 ， 并 且 
强度 和 音调 可 能 会 变化 ; 其 可 能 由 于 肺 部 狭窄、 支气管 
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哮 鸣 音 一 般 布 满 整 个 呼 气相 或 吸 气 相 ， 经 过 大 量 数 
据 的 统计 ， 其 持续 时 间 一 般 >250 ms。 本 研究 采用 红色 
标 出 以 哮 鸣 音 片 段 峰值 为 中 心 的 500 ms 信号 , 详 见 图 3。 
经 过 大 量 数据 的 测试 ， 本 研究 团队 发 现 500 ms 在 绝 大 
多 数 情况 下 能 够 覆盖 呼吸 相 或 吸 和 气相 的 80% 以 上 。 
3.3.2 ” 湿 哆 音 的 波峰 和 哮 鸣 音 的 波峰 定量 分 析 : 通过 对 
超过 1500 个 湿 嘿 音 进行 统计 ， 发 现 湿 嘿 音 的 波峰 幅 值 
是 湿 嘿 音 平均 幅 值 的 2 倍 以 上 。 使 用 软件 Matlab， 呈 现 
出 了 16 个 湿 嘿 音频 谱 图 ， 其 中 红色 的 线 是 湿 虽 音 平均 
晶 值 的 2 倍 ， 详 见 图 4。 
通过 对 超过 100 个 哮 鸣 音 测试 ， 发 现 用 200 ms 长 
的 汉 明 窗 对 哮 鸣 音 能 量 值 进行 低 通 滤波 ， 绝 大 部 分 低 通 
滤波 后 的 哮 鸣 音 片段 有 160 ms 的 峰值 部 分 会 大 于 滤波 
后 信号 的 平均 值 (图 5 的 红线 ) 。 如 图 5 所 示 ， 本 研究 


疾 挛 、 梗 阻 或 病变 引起 。 哮 鸣 音 的 持续 时 间 也 可 以 因 患 
者 情况 而 异 ， 从 数秒 钟 到 数 分 钟 不 等 ' 。 

湿 嘿 音 是 偶发 性 的 非 连 续 信 号 , 基于 音频 数据 分 析 ， 
笔者 发 现 其 持续 时 间 一 般 <20 ms。 本 研究 团队 使 用 软 
件 Matlab， 星 现 出 16 个 湿 哩 音频 谱 图 ， 其 中 红色 的 部 
分 为 以 湿 嘿 音 峰值 为 中 心 的 20 ms 信号 ， 详 见 图 2。 
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3.3.3 ”利用 支持 向 量 机 ( support vector machine，SVM ) 
法 进行 湿 哆 音 和 哮 鸣 音 的 识别 :SVM 是 一 种 常用 的 监 
督学 习 算 法 ， 主 要 用 于 分 类 和 回归 分 析 。 它 是 一 种 二 类 
分 类 模型 ， 通 过 最 大 化 分 类 边界 与 数据 之 间 的 间隔 来 对 
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Figure 4 Spectrogram of moist rale 
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新 的 数据 进行 预测 。SVM 是 基于 统计 学 习 理 论 ， 通 过 
在 高 维 空间 中 找到 最 优 分 类 超 平 面 来 对 样本 进行 分 类 ， 
还 可 以 用 于 回归 分 析 、 异 常 检测 和 时 间 序 列 预测 等 任务 ， 
是 一 种 广泛 应 用 于 机 器 学 习 和 数据 挖掘 领域 的 算法 ， 具 
有 和 较 高 的 准确 性 和 和 鲁 棒 性 ' 1。 

利用 SVM 进行 肺 部 听诊 音 识 别 是 一 种 基于 机 器 学 
习 和 信和 号 处 理 的 技术 ， 其 基本 原理 是 通过 对 肺 部 听诊 音 
信和 号 进行 特征 提取 和 分 类 ， 从 而 实现 肺 部 听诊 音 的 识别 
和 分 类 。 通 过 训练 SVM 模型 ， 可 以 根据 已 有 的 肺 部 听 
诊 音 数 据 和 对 应 的 标签 ( 如 正常 肺 音 、 异 常 肺 音 ) 来 建 
立 分 类 模型 1; 。 这 个 模型 可 以 用 于 对 肺 部 听诊 音 数据 
进行 预测 和 分 类 ， 从 而 辅助 临床 诊断 。SVM 在 肺 部 听 
诊 音 识别 中 的 优势 在 于 ， 其 可 以 处 理 高 维 数据 和 复杂 的 
非 线 性 关系 ， 通 过 核 隐 数 将 原始 数据 映射 到 高 维特 征 空 
间 中 ， 从 而 避免 了 手动 设计 特征 和 选择 特征 空间 的 复杂 
性 。 同 时 ，SVM 具有 和 较 高 的 准确 性 和 重 棱 性 ， 能 够 处 
理 各 种 不 同类 型 和 质量 的 肺 部 听诊 音 数 据 。 

在 本 研究 中 ， 笔 者 团队 尝试 利用 SVM 法 对 肺 部 听 
诊 音 进行 湿 嘿 音 和 哮 鸣 音 的 识别 ， 主 要 包括 音频 数据 库 
的 建立 、 信 号 特征 提取 、 向 量 机 训练 及 向 量 机 预测 4 个 
部 分 。 与 绝 大 多 数 研究 不 同 的 是 ， 本 研究 的 训练 数据 集 
包含 的 并 不 是 整个 肺 音 采 录 文件 ， 而 是 经 过 预 处 理 的 音 
频数 据 片段 , 包括 正常 音频 片段 和 异常 音频 片段 。 其 中 ， 
湿 嘿 音 片段 以 湿 哩 音 片段 峰值 为 中 心 的 20 ms 信号 组 成 ， 
哮 鸣 音 片 段 以 哮 鸣 音 片段 峰值 为 中 心 的 500 ms 信号 组 
成 。 这 样 做 的 好 处 主要 有 两 个 ， 其 一 ， 以 峰值 为 中 心 的 
信号 片段 信号 强 ， 信 噪 比 高 ， 从 而 可 以 比较 好 的 降低 背 
景 噪音 造成 的 干扰 ， 提 高 算法 的 准确 度 ; 其 二 ， 以 峰值 
为 中 心 的 信号 片段 数据 量 较 小 ， 从 而 明显 减少 信号 处 理 
时 间 ， 提 高 算法 的 实时 性 、 实 用 性 。 

在 采集 肺 部 听诊 音 的 过 程 中 ， 本 研究 发 现 听 诊 器 探 
头 注 膜 随 着 健康 受 试 者 吸 气 胸腔 扩张 被 动 错位 或 探头 在 
转移 过 程 中 都 会 产生 伪 湿 嘿 音 ， 且 现 阶段 无 法 避免 "1。 
为 了 能 够 提高 识别 湿 嘿 音 的 准确 度 ， 笔 者 也 对 伪 湿 嘿 音 
进行 人 工 标注 和 识别 且 建 立 伪 湿 嗓音 的 音频 数据 库 ， 为 
后 续 能 够 实现 对 伪 湿 嘿 音 的 自动 识别 作 准 备 。 本 研究 提 
取 的 每 个 湿 嘿 音 片段 时 长 为 20 ms， 通 过 算法 及 半 人 工 
参与 的 方式 建立 真性 和 伪 湿 哩 音 片段 库 ， 详 见 图 6， 显 
示 的 是 部 真 、 伪 湿 哩 音 片 段 建 库 过 程 。 

为 了 进一步 处 理 和 分 析 肺 音信 号 ， 本 研究 运用 小 波 
变换 方法 ， 对 湿 嘿 音 与 伪 湿 嘿 音 进行 处 理 ， 并 提取 其 频 
域 特征 。 这 些 特征 值 是 从 信号 的 基本 波形 和 频谱 中 提取 
出 来 的 。 将 计算 出 的 时 域 和 频 域 特征 值 作为 输入 变量 ， 
利用 经 过 训练 的 SVM 模型 来 对 它们 进行 分 类 。 通 过 信 
号 的 小 波 变换 分 解 、 特 征 值 的 计算 ， 以 及 SVM 分 类 模 
型 的 应 用 能 够 以 较 高 的 准确 率 来 识别 和 区 分 正常 与 异常 
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的 呼吸 音 。 具 体 的 算法 识别 过 程 与 结果 如 下 : 

(1) 本 研究 结合 自动 算法 和 人 工 审核 技术 ， 深 入 
分 析 肺 音 数据 。 研 究 建立 了 两 个 数据 库 ， 一 个 收集 真实 
湿 嘿 音 ， 男 一 个 收集 伪 湿 哪 音 。 由 于 真实 湿 喝 音 通常 不 
超过 20 ms， 人 研究 确保 所 有 声音 样本 长 度 为 20 ms， 以 
精确 捕获 这 些 短暂 信和 号。 通过 分 析 这 些 样本 ,提取 了 关 
键 的 时 域 和 频 域 特征 ， 这 对 分 类 湿 嘿 音 很 重要 ， 详 见 图 
7。 研 究 还 使 用 SVM 算法 对 特征 进行 训练 和 优化 ， 成 功 
区 分 真 假 湿 喝 音 。 


经 预 处 对 信号 通过 算法 找 出 湿 哆 音 的 波 
理 的 音 一 一 了 > 进行 带 一 一 > 峰 幅 值 是 平均 幅 值 2 倍 以 
频 文件 通 滤波 上 的 所 有 20 ms 片段 


存储 至 真 湿 喝 人 工 对 疑似 湿 

音 片段 库 中 音 片段 确认 
了 

存储 至 假 湿 

喝 音 片段 库 


图 6 真 、 伪 湿 嘿 音 片 段 建 库 过 程 
Figure 6 The process of creating audio databases of true and fake moist 


rale 


(2 ) 研究 首先 对 肺 音信 号 进行 预 处 理 ， 然 后 通过 
带 通 滤波 器 处 理 ， 强 调 100~2 000 Hz 频率 范围 内 的 关 
键 信号 ， 该 范围 被 认为 含有 诊断 相关 的 重要 信息 。 使 用 
20 ms 的 时 间 窗 口 逐步 扫描 整个 信号 ， 以 连续 搜索 并 捕 
捉 瞬 时 湿 吗 音 。 每 发 现 一 个 潜在 的 湿 哆 音 ， 就 从 该 段 信 
号 提取 时 域 和 频 域 特 征 , 并 将 这 些 特征 用 于 SVM 模型 ， 
以 区 分 真实 和 伪 湿 哩 音 。 
通过 算法 及 半 人 工 参 与 , 从 肺 音 中 提取 两 个 声音 库 ， 
其 中 一 个 声音 库 由 湿 嘿 音 组 成 ， 男 外 一 个 由 伪 湿 哩 音 组 
成 。 由 于 湿 嘿 音 基本 小 于 20 ms， 因 此 本 研究 提取 的 每 
个 声音 档 为 20 ms。 

提取 真 湿 嘿 音 和 伪 湿 嘿 音 的 时 域 特征 值 及 频 域 特 诊 
值 ， 然 后 利用 向 量 机 进行 训练 ， 得 出 向 量 机 参数 。 利 用 
该 向 量 机 参数 可 以 很 好 的 分 辨 真 湿 嘿 音 和 伪 湿 哩 音 。 先 
进行 信号 预 处 理 ， 重 采样 和 识别 弱 信 号 ， 然 后 对 呼吸 音 
信和 号 进行 带 通 滤波 ( 肺 音信 号 主要 在 100~2 000 Hz ) ， 
然后 计算 智能 阔 值 ( 每 段 呼 吸音 信号 都 有 自己 的 靖 值 ， 
根据 该 闷 值 找 出 潜在 湿 嘿 音 ) ， 然 后 用 20 ms 的 窗 沿 着 
肺 音信 号 移动 ， 找 出 所 有 潜在 湿 嘿 音 。 提 取 潜 在 湿 嘿 音 
的 时 域 特征 和 频 域 特征 ， 并 用 向 量 机 进一步 判断 该 潜在 
湿 嘿 音 是 真 湿 嘿 音 还 是 伪 湿 哩 音 ， 最 后 根据 该 呼吸 音 平 
均 1s 所 含 湿 嘿 音 的 数量 来 判断 该 呼吸 音 是 否 为 湿 嘿 音 
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图 7 真 湿 哆 音 和 假 湿 嘿 音 小 波 分 解 结 


Figure7 Results of wavelet decomposition of true moist rale and false moist rale 


或 哮 鸣 音 ， 图 中 的 蓝 色 圈 圈 标 示 的 是 伪 湿 呢 音 ， 红 色 圈 
圈 标 示 的 是 真 湿 哪 音 ， 详 见 图 8。 
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Figure 8 Support vector machine results 


fortime domain feature processin 


由 于 哮 鸣 音 会 布 满 整个 呼 气相 或 吸 气 相 ， 所 以 本 人 研 


究 提 取 的 每 个 哮 鸣 音 片 段 为 500 ms， 绝 大 部 分 情况 下 ， 


500 ms 能 够 覆盖 整个 呼 气相 或 


吸 气 相 80% 以 上 。 通 过 


算法 及 半 人 工 参与 的 方式 建立 哮 鸣 音 片 段 库 ， 如 图 9 所 


示 。 应 用 训练 向 量 机 识别 湿 虽 


音 和 哮 鸣 音 的 过 程 ， 详 


见 图 10~11。 应 用 向 量 机 识别 肺 音 的 完整 流程 ， 详 见 图 


12。 


3.3.4 利用 小 波 分 解法 对 肺 部 听诊 音 进行 特征 提取 : 小 


波 分 解 是 一 种 信号 分 析 方 法 ， 月 


于 将 信号 分 解 为 不 同 尺 


度 和 频率 的 成 分 ， 以 便 更 好 地 分 析 信 号 的 特点 和 特征 。 


小 波 分 解 通过 使 用 小 波 函 数 进 


了 伸缩 和 平移 操作 ， 将 信 


号 分 解 为 多 个 频率 成 分 ， 壁 如 湿 嘿 音 分 解 后 的 信号 频率 


分 布 ， 详 见 表 1。 每 个 成 分 具有 不 同 的 尺度 和 形状 。 这 
种 分 解 方法 可 以 在 一 定 程度 上 消除 信号 中 的 噪声 ， 并 且 
可 以 对 信号 进行 压缩 ， 减 小 数据 量 。 小 波 分 解 在 信号 处 
理 、 图 像 处 理 、 医 学 影像 等 领域 有 着 广泛 的 应 用 '" 。 
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Figure 9 The process of creating an audio database of wheezing soud 
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Figure 10 Training Vector Machines to recognise moist rale 
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Figure 11 Training Vector Machines to recognise wheezing soud 
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判断 是 否 
为 正常 肺 音 


纳入 正常 ”判断 为 
肺 音 库 ” 异常 肺 音 
y 
向 量 机 识 
别 湿 哩 音 
是 y yY 否 
归 入 湿 哪 ”向 量 机 识 
音 库 。” 别 干 哆 音 
归 入 湿 嘿 ”向 量 机 识 
裔 由 别 干 哪 音 
图 12 向 量 机 识别 肺 音 流程 


Figure 12 Vector Machine Recognition of Lung Sounds Process 


肺 音 、 普通 、 向 量 机 
文件 也 滤波 识别 六 


肺 部 听诊 音 是 一 种 复杂 的 生理 信号 ， 包 含 了 多 种 频 
率 和 特征 的 成 分 。 小 波 分 解 应 用 于 肺 部 听诊 音 特征 提取 
的 原理 主要 是 基于 信号 的 频 域 特性 。 小 波 分 解 通 过 使 用 
小 波 基 函 数 对 肺 部 听诊 音 进 行 分 解 ， 将 信和 号 分 解 为 不 同 
尺度 和 频率 的 成 分 , 从 而 更 好 地 分 析 信 号 的 特点 和 特征 。 
这 些 成 分 可 以 反映 肺 部 听诊 音 在 不 同时 间 和 空间 上 的 变 
化 特征 ， 从 而 为 特征 提取 和 分 析 提 供 更 丰富 的 信息 "| 。 
通过 小 波 分 解 , 可 以 提取 肺 部 听诊 音 中 的 不 同 频率 成 分 ， 
例如 高 频 成 分 可 能 代表 呼吸 急促 、 咳 嗽 等 症状 ， 低 频 成 
分 可 能 代表 呼吸 节律 等 特征 。 这 些 特征 可 以 用 于 构建 分 
类 模型 ， 用 于 识别 不 同 的 肺 部 疾病 或 症状 。 

本 研究 将 输入 声音 片段 分 解 成 和 D1、D2、D3、 
D4、D5、D6、D7、A8 共 8 段 不 同 频率 的 信和 号， 小 波 分 
解 肺 音 的 过 程 ， 详 见 图 13。 湿 哩 音 音频 的 分 解 结 
详 见 图 14。 


D1 
SE > D2 
“eg Al Da 
S30 DN > D4 
和 < 国 - 一 
Sa A4 
注 : s [x] 是 输入 信号 ，Dn 是 高 频 部 分 ，An 是 低频 部 分 。 


图 13 小波 分 解 肺 音 的 过 程 


Figure 13 Wavelet decomposition of lung sounds 


[me 


对 于 分 解 出 的 8 段 信号 ， 本 研究 提取 如 下 特征 ( 共 
提取 32 个 特征 值 ) : (1) 提取 每 段 信号 绝对 值 的 平均 
值 , 共 8 个 平均 值 ，(2 ) 提取 每 段 信 号 绝对 值 的 方差 ， 
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共 8 个 方差 | (3 ) 提取 每 段 信号 绝对 值 的 最 大 值 ， 共 
8 个 最 大 值 ，(4) 提取 8 个 平均 值 相 邻 值得 比值 。 分 
别 为 mean( abs( sl x | ) )/mean( abs( D1 ), mean( abs(D1 ) ) 
/mean( abs(D2 ) ) , mean( abs( D2 ) )/mean( abs( D3 ) ) ， 
mean (abs(D3 ) )/mean(abs(D4) ), mean(abs( D4)) 
/mean (abs( D5 ) ) , mean(abs(D5 ) )/mean( abs( D6 ) )， 
mean (abs(D6) )/mean (abs (D7) ), mean(abs (D7)) 
/mean (abs (A7) ) 。 

特征 1~8 (8 个 平均 值 ) 和 特征 17~24 (8 个 最 大 值 ) 
代表 了 湿 哆 音 在 不 同 频率 的 能 量 分 布 ， 特 征 9~16 (8 个 
方差 ) 和 25~32 ( 相 邻 值得 比值 ) 代表 了 湿 嘿 音 在 不 同 
频率 的 能 量变 化 情况 。 


表 1 湿 喝 音 分 解 后 的 信号 频率 分 布 


Table 1 Frequency distribution of the signal after decomposition of moist 


rale 
分 解 后 的 信号 频率 分 布 ( Hz ) 

D1 1 000~2 000 
D2 500~1 000 
D3 250~500 
D4 125~250 
D5 62.5~125.0 
D6 31.2~62.5 
D7 15.6~31.2 
A8 0~15.6 


4 应 用 与 结论 


应 用 上 述 采 集 肺 部 听诊 音 的 操作 流程 与 建立 肺 部 听 
诊 音 音频 数据 库 的 技术 方法 ， 本 研究 采集 了 392 例 呼吸 
慢 病 患者 ， 合 格 入 库 3362 条 音频 数据 ， 另 有 56 例 健 康 
人 的 肺 部 听诊 音 500 条 音频 数据 ， 以 及 采用 国立 台湾 
大 学 生物 医学 电子 与 生物 信息 学 研究 生 院 公布 的 HF_ 
Lung_V1、 国 际 生 物 医 学 与 健康 信息 学 会 议 公 布 的 呼 
吸音 数据 库 及 上 海 交 通 大 学 公布 的 SPRSound 数据 库 共 
9469 条 音频 数据 。 应 用 软件 MetLab R2017a 进行 数据 管 
理 和 分 析 ， 对 音频 数据 进行 预 处 理 、 数 据 标注 、 向 量 机 
识别 、 特 征 提取 等 ， 基 于 呼吸 音 分 析 算法 软件 ， 可 以 自 
动 导入 呼吸 音 并 频谱 化 显示 ， 并 通过 SVM 算法 建立 的 
正常 和 异常 呼吸 音 模 型 库 ， 自 动 识 别 出 正 常 肺 音 , 干 、 
湿 嘿 音 ， 并 在 呼吸 音频 谱 图 上 精确 标注 所 在 位 置 。 应 用 
程序 界面 识别 肺 部 听诊 音 示 例 ， 详 见 图 15。 

呼吸 疾病 的 早 发 现 、 早 诊断 、 早 干预 ， 有 利于 获得 
呼吸 慢 病 患者 有 效 管理 的 关键 节点 。 肺 部 听诊 音 数据 库 
的 建立 和 相关 方法 研究 为 日 后 实现 对 肺 部 听诊 音 的 智能 
判读 和 居家 应 用 健康 管理 产品 的 研发 商定 基 ， 甚 至 可 以 
协助 呼吸 道 传染 临床 诊治 ， 也 为 后 期 研制 国产 质 优 价 廉 
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Figure 14 Results of the wavelet decomposition of moist rale 
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肺 音 及 滤波 - 
湿 喝 音 _ 哮 鸣 音 _ 段 落 


特征 片段 数量 : 14 《一 1 一 


pr 
原始 声音 


带 通 滤 波 后 的 肺 音 特征 片段 类 型 : ~ 〇 特征 片段 波形 
〇 小 波 变换 1 口 小 波 变换 2 〇 小 波 变换 3 〇 小 波 变换 4 
〇 小 波 变换 5 〇 小 波 变换 6 〇 小 波 变换 7 〇 小 波 变换 8 


图 15 应 用 程序 界面 识别 肺 部 听诊 音 示 例 


分 析 结 果 及 建议 。 温 史 音 


加 载 A-120191230141945_p5-1.wav 


采样 率 (HZ) Sa 
时 长 (S) 8 
肺 音 分 析 
湿 哄 音 分 析 
10 Cracks/4s 


发 现 疑 似 湿 喝 音 
请 更 换 听 诊 器 位 置 进 


如 果 有 咳嗽 发 热 等 症状 ， 建 议 到 医 角 


时 鸣 音 分 析 


哮 鸣 音 数量 : | 0 


没 发 现 哮 鸣 音 


Figure 1$ Example of an application interface to recognise lung auscultation sounds 


的 智能 判读 听诊 器 提供 技术 借鉴 。 
本 研究 局 限 性 : 目前 这 个 数据 库 中 的 病理 性 肺 音 片 ”成 多 
段 相 对 较 少 ， 这 可 能 是 由 以 下 儿 个 因素 造成 的 ，(1) 言 是 极其 宝贵 的 ; 


如 


那些 可 能 会 呈现 更 加 明显 肺 部 异常 声音 的 患者 群体 并 未 健康 状况 已 经 有 所 改善 ， 


的 患者 也 未 能 被 纳入 本 人 研究， 复杂 的 临床 情况 可 能 会 造 


化 的 肺 音 变化 ， 而 这 部 分 信息 对 于 肺 音 数据 库 而 


(3 ) 医生 在 更 新 患者 病历 时 可 能 会 
本 研究 并 没有 涵盖 那些 病情 特别 严重 的 患者 ， 这 意味 着 ”有 所 延迟 ， 这 可 能 导致 在 收集 肺 音 的 时 候 ， 患 者 的 实际 


[= 


= = 


比如 ， 如 果 患 者 的 病情 在 稳定 


被 包括 在 内 ; (2) 那些 同时 受 多 种 呼吸 系统 疾病 影响 。 期 ,那么 其 肺 部 的 
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帅 声 首 


可 能 会 相对 较 弱 ， 甚 至 在 检 


(CI 上 > 中 国 全 科 医 学 二 成 和 


测 时 不 再 明显 。 这 种 情况 下 ， 收 集 到 的 肺 音 可 能 就 不 能 
准确 反映 患者 在 更 加 活跃 病程 阶段 的 肺 音 特征 。 
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